엔비디아, 기억 수정 최적화 선형 어텐션 모델 공개
엔비디아가 기존 선형 어텐션 모델들의 한계였던 '기억 덮어쓰기' 문제를 해결한 'Gated DeltaNet-2'를 발표했습니다. 이 모델은 기존의 단일 게이트를 키(Key) 축의 '삭제 게이트'와 값(Value) 축의 '쓰기 게이트'로 분리하여 메모리를 더 정교하게 제어합니다. 그 결과, Mamba-2, Mamba-3 등 기존 최고 성능 모델들을 벤치마크에서 모두 능가하는 우수한 성능을 입증했습니다.